Refinamiento adaptativo de subobjetivos de grueso a fino para el aprendizaje por refuerzo offline condicionado por objetivos de horizonte largo
Refinamiento adaptativo de subobjetivos para RL offline de horizonte largo. Mejora la planificación y eficiencia en problemas complejos.